Notebooks for training/inference `nb_*`

minimal scripts, commented and self-explanatory

Tools in `utils.py`

ModelPredictionGenerator

Little helper for batch inference, see nb_batch-inference.ipynb for usage or this:

model, tokenizer = ..
dataset = load_dataset("g-ronimo/oasst2_top4k_en")["test"]

generator = ModelPredictionGeneratorDistributed(
    model = model,
    tokenizer = tokenizer,
)
results = generator.run(
    input_data = eval_ds,
    batch_size = 2,
)

ModelPredictionGeneratorDistributed

Same as ModelPredictionGenerator but for multi-GPU inference with HF accelerate.

EmbeddingModelWrapper

Calculate embedding vectors and cosine similarities of a list of strings; default embedding model is sentence-transformers/all-mpnet-base-v2.

from utils import EmbeddingModelWrapper
em = EmbeddingModelWrapper()

words = ["lemon", "orange", "car", "money"]
embds = em.get_embeddings(words)

similarities = em.get_similarities(embds)

SingleChoiceEval

Calculate accuracy of a given model on a single-choice dataset.

MMLU

from transformers import AutoModelForCausalLM, AutoTokenizer
from datasets import load_dataset
import torch

modelpath = "models/TinyLlama-1.1B-intermediate-step-1431k-3T"

# Load model
model = AutoModelForCausalLM.from_pretrained(
    modelpath,    
    torch_dtype = torch.bfloat16,
    device_map = "auto",
    attn_implementation = "flash_attention_2",
)
tokenizer = AutoTokenizer.from_pretrained(modelpath, use_fast=False) 
tokenizer.pad_token = tokenizer.unk_token
tokenizer.padding_side = "left"

dataset = load_dataset("cais/mmlu", "all")

from utils import SingleChoiceEval

sce = SingleChoiceEval(dataset["dev"])
total, correct, acc = sce.calc_accuracy(
	model, 
	tokenizer, 
	batch_size = 16
)

Output TinyLlama

(285, 66, 23.157894736842106)

PIQA 5-shot

# load model and tokenizer just like before
...

from utils import SingleChoiceEval
from datasets import load_dataset

tokenizer.pad_token = tokenizer.unk_token
tokenizer.padding_side = "left"

dataset = load_dataset("piqa")

sce = SingleChoiceEval(
    dataset["validation"], 
    key_choices = ['sol1', 'sol2'],
    key_question = "goal",
    key_answer = "label"
)
total, correct, acc = sce.calc_accuracy(
    model, 
    tokenizer, 
    few_shots = dataset["train"].select(range(5)),
    batch_size = 16,
)

Output Mistral-0.2 (base):

(1838, 1474, 80.19586507072906)

Kaggle's LLM Science Exam

# load model and tokenizer just like before
...

# this part is new
from datasets import load_dataset
from utils import SingleChoiceEval

dataset = load_dataset("g-ronimo/kaggle_llm_science_exam")

tokenizer.pad_token = tokenizer.unk_token
tokenizer.padding_side = "left"

sce = SingleChoiceEval(
    dataset["test"], 
    key_choices = ['A', 'B', 'C', 'D', 'E'],
    key_question = "prompt"
)
total, correct, acc = sce.calc_accuracy(
    model, 
    tokenizer, 
    batch_size = 16
)

Output TinyLlama

(600, 135, 22.5)

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
README.md		README.md
challenging_prompts.json		challenging_prompts.json
nb_MistraLlama_QLoRA.ipynb		nb_MistraLlama_QLoRA.ipynb
nb_OpenELM-450M_finetune-full.ipynb		nb_OpenELM-450M_finetune-full.ipynb
nb_TinyLlama_finetune-full.ipynb		nb_TinyLlama_finetune-full.ipynb
nb_batch-inference.ipynb		nb_batch-inference.ipynb
nb_finetune-full_OpenELM-450M.ipynb		nb_finetune-full_OpenELM-450M.ipynb
nb_lama2-7b_galore.ipynb		nb_lama2-7b_galore.ipynb
nb_llama2-7b_LISA.ipynb		nb_llama2-7b_LISA.ipynb
nb_llama3-8b_orthogonalize.ipynb		nb_llama3-8b_orthogonalize.ipynb
nb_llama3-tweet-labeling.ipynb		nb_llama3-tweet-labeling.ipynb
nb_mmlu_eval.ipynb		nb_mmlu_eval.ipynb
nb_phi-2_QLoRA.ipynb		nb_phi-2_QLoRA.ipynb
nb_speculative_decoding.ipynb		nb_speculative_decoding.ipynb
qlora_llama3-8b-slimhermes.py		qlora_llama3-8b-slimhermes.py
requirements.txt		requirements.txt
utils.py		utils.py

geronimi73/3090_shorts

Folders and files

Latest commit

History

Repository files navigation

Notebooks for training/inference nb_*

Tools in utils.py

ModelPredictionGenerator

ModelPredictionGeneratorDistributed

EmbeddingModelWrapper

SingleChoiceEval

MMLU

PIQA 5-shot

Kaggle's LLM Science Exam

About

Resources

Stars

Watchers

Forks

Languages

Notebooks for training/inference `nb_*`

Tools in `utils.py`